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The voice controlled access system has a memory 2, a processor 1, a recorder 4, a loudspeaker 8, several batteries 3,6, two 
input keys T1 ,T2 and a main switch 5 controlling the activation of the vehicle electronic system 7. A spoken command is 
recorded, and the analogue signal is converted into a digital format for entering into the memory. The processor compares the 
command with the digitised reference speech patterns. 
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Prufungsantrag gem. § 44 PatG ist gestellt 

© Verfahren zum Identif izieren einer menschlichen Stimme 

(§) Die Erfindung stellt ein zuveriassig arbeitendes Verfahren 
und eine solche Vorrichtung zum Identifizieren einer 
menschlichen Stimme bereft, insbesondere zum Sichem von 
Gegenstanden gegen Diebstahl, umfassend 

(a) das Aufnehmen der Stimme mit Hilfe einer Aufnahme- 
einheit, 

(b) das Umwandeln der aufgenommenen akustischen Signa- 
le In aiaktrische Signale, 

(c) das Dtgitalisieren und Abspeichern der Signale in einer 
Auswerteeinheit mit Speicher, 

wobei ggf. die obigen Schritte (a) bis (c) mit weiteren 
Stimmen wiederholt werden und 

(d) das Vergleichen der digitalisiartert Signale der Stimme 
mit solchen, die sich bereits im Speicher der Auswerteein- 

m heit befinden, und ggf. das Identifizieren der Stimme ais im 
f wesentlichen identisch mit einer der Stimmen, die im 
Speicher der Auswerteeinheit gespeichert sind. 
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Beschreibung 

Die vorliegende Erfindung betrifft das Gebiet der 
akustischen Personenidentifikation. Das erfindungsge- 
maBe Verfahren eignet sich beispielsweise zum Sichern 5 
von Gegenstanden gegen Diebstahl, wobei die Identifi- 
kation einer Stimme als Schliissel fungiert. Diese Identi- 
f ikation muB zuverlassig arbeiten, soilte aber gleichwohl 
im Rahmen eines vertretbaren Hard- und Softwareauf- 
wandes liegen. 10 

ErfindungsgemaB wird diese Aufgabe dadurch gelost, 
daB ein Verfahren zum Identifizieren einer menschli- 
chen Stimme bereitgestellt wird, welches das Aufneh- 
men der Stimme mit Hilfe einer Aufnahmeeinheit, das 
Umwandeln der aufgenommenen akustischen Signale in 15 
elektrische Signale sowie das Digitalisieren und Abspei- 
chern der Signale in einer Auswerteeinheit mit Speicher 
umfaBt ErfindungsgemaB ist es moglich, daB mehrere 
Stimmen und/oder mehrere Laut folgen ein und dersel- 
ben Stimme mittels der genannten Schritte im Speicher 20 
abgelegt, d. h. "eingelernt" werden. Zum Identifizieren 
einer bestimmten Stimme werden dann die wie oben 
erhaltenen digitalisierten Signale dieser Stimme mit sol- 
chen anderer Stimmen, die sich bereits im Speicher der 
Auswerteeinheit befinden, verglichen. Dabei kann die 25 
Stimme vom System als im wesentlichen identisch mit 
einer der Stimmen, die bereits gespeichert sind, identifi- 
ziert oder als unbekannt erkannt werden (Anspruch 1, 
Anspruch 10). 

Das erfindungsgemaBe Verfahren laBt sich besonders 30 
vorteiihaft beim Sichern von Gegenstanden einsetzen, 
wobei die Identifikation der Stimme als "Schlussel fun- 
giert (Anspruch 11). Dieser "Schlussel" kann beispiels- 
weise das Unterbrechen oder SchlieBen eines Strom- 
kreises sein. Auch andere Arten von SchlieBfunktionen 35 
sind denkbar (Computer-Zugangsberechtigung, Perso- 
nen-Identifikation beim Online-Banking oder Einsatz in 
Geldautomaten). Um einen solchen Freigabe- oder 
SchlieBmechanismus zu konstruieren, wird eine Stimme 
oder werden mehrere Stimmen, bevorzugt in Form ei- 40 
ner charakteristischen Laut- bzw. Tonabfoige, in digita- 
lisierter Form im Speicher abgelegt. Die digitalisierten 
Charakteristika dieser Stimme oder Stimmen dienen als 
"SchloB". Nur solche Personen, deren Stimmen abge- 
speichert sind, verfugen uber den zu diesem SchloB ge- 45 
horigen "Schlussel". Zum "AufschlieBen" muB diese Per- 
son die genannten Laut- oder Tonfolgen, beispielsweise 
ein bestimmtes Codewort, von sich geben. In einer be- 
vorzugten Ausfuhrungsform der Erfindung laBt sich die- 
se "SchlieBfunktion" aktivieren und deaktivieren, bei- 50 
spielsweise indem zwei Schalter den Ablauf der einzel- 
nen Verfahrensschritte so steuern, daB der eine Schalter 
das Aufnehmen, Umwandeln und Speichern der Signale 
ermoglicht, wahrend der andere Schalter das Verglei- 
chen und ggf. Identifizieren ermoglicht (Anspruch 2). 

In einer bevorzugten Ausfuhrungsform laBt sich das 
Verfahren zum Sichern von Kraftfahrzeugen gegen 
Diebstahle einsetzen (Anspruch 4, Anspruch 5). Be- 
kanntiich nimmt die Zahl von Kfz-Diebstahlen, insbe- 
sondere bei teueren Modelle, drastisch zu, so daB erhoh- 
te und zusatzliche SchutzmaBnahmen erforderlich sind. 
Gieichzeitig setzen Versicherungen fur eine Kostener- 
stattung im Schadensfall wirksame SicherungsmaBnah- 
men gegen unbefugte Benutzung voraus. Besonders 
vorteiihaft ist das vorliegende Verfahren, weii es mit 
einem unverlierbaren Schlusselsystem arbeitet Siche- 
rungssysteme im Stand der Technik basieren im wesent- 
lichen auf mechanischen oder elektronischen Schlusseln, 
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ohne die zwar eine unbefugte Benutzung oft wirkungs- 
voll verhindert wird, bei deren Verlust oder Diebstahl 
das Kfz jedoch sofort entwendet werden kann. 

In einer bevorzugten Ausfuhrungsform wird bei der 
Verwendung des erfindungsgemaBen Verfahrens zum 
Sichern von Kraftfahrzeugen deren Elektrik unterbro- 
chen und erst dann wieder freigegeben, wenn sich ein 
Benutzer durch Sprechen eines Codewortes, beispiels- 
weise seinen Namen, oder aber auch durch ein anderes 
eingespeichertes akustisches Signal zu erkennen gibt. 

Ausschlaggebend fur die Identifikation ist dabei die 
Kombination vieler Merkmale der Stimme der jeweili- 
gen Person, beispielsweise Stimmfarbe, Tonhohe, usw. 
die sich von anderen nicht imitieren lassen; ahnlich der 
Eigenschaft von Fingerabdrucken. 

Die Verwendung des erfindungsgemaBen Verfahrens 
ist auch deshalb besonders vorteiihaft, da Speicher- und 
Logikbausteine standig biiliger werden und die meist 
bereits vorhandene Elektronik im Kfz, insbesondere bei 
teureren Modellen, beispielsweise das Vorhandensein 
eines Bordcomputers mit Speicher und Recheneinheit, 
die Installierung des entsprechenden Systems kosten- 
giinstig ermoglicht, bei schon vorhandenen Hardware- 
Konzept und Erganzung eines vertretbaren Aufwandes 
an Software. 

Um den Gegenstand zu sichern, ist die Auswerte- und 
Steuereinheit, mit der das Aufnehmen und Vergleichen 
der Stimmen ermoglicht wird, so mit dem zu sichernden 
Gegenstand verbunden, daB die Benutzung des Gegen- 
standes bei Feststellen der Identitat der Stimme mit 
einer solchen, deren Signale bereits in der Auswerteein- 
heit des Speichers abgelegt sind, moglich ist; bei Fest- 
stellen mangelnder Identitat aber unmdglich ist. Dies 
kann beispielsweise durch einen Schalter in einem 
Stromkreis des Gegenstandes erfolgen, ohne dessen 
Geschlossensein der Gegenstand nicht in Benutzung 
oder in Betrieb genommen werden kann. Im Falle der 
Sicherung eines Kraftfahrzeugs kann es sich dabei um 
einen Schalter handeln, der beim Erkennen einer abge- 
speicherten Stimme die vorher gesperrte Bordelektrik 
oder -elektronik freigibt. 

Das erfindungsgemaBe Verfahren wird mit Hilfe ei- 
ner Auswerte- und Steuereinheit durchgefuhrt, die z. B. 
aus einem ASIC bestehen kann. Diese Einheit steuert 
sowohl das Einlernen als auch das Vergleichen und 
Identifizieren der Stimme: in einer Aufnahmeeinheit, 
beispielsweise mit Mikrofon, wird die Stimme des Be- 
nutzers zuerst in elektrische Signale umgewandelt, evtl. 
bandgefiltert und dann digitalisiert. Das digitalisierte Si- 
gnal wird an die Auswerteeinheit weitergegeben und 
dort verglichen. Bevorzugt wird dabei ein Vergleichsal- 
gorithmus eingesetzt, der in der Auswerteeinheit abge- 
speichert sein kann. Dieser Vergleichsalgorithmus hat 
zum Ziel, die digitalisierten Daten einer sich identifizie- 
renden Person mit den im System gespeicherten Daten 
anderer, beispielsweise zum Benutzen des Gegenstan- 
des befugter Personen zu vergleichen und so zu ent- 
scheiden, ob es sich bei der sich identifizierenden Person 
um eine befugte Person handelt. 

Der Vergleichsalgorithmus berechnet eine Short-Ti- 
me- Fouriertransformation der eingehenden digitalisier- 
ten Daten. Der dabei entstehende neue Datenvektor 
(auch Merkmalsvektor genannt) wird mit Hilfe eines 
Klassifikationsverfahrens mit den abgespeicherten Da- 
ten verglichen. Als Klassifikatoren konnen statistische 
Klassifikationsverfahren, neuronale Netze oder syner- 
getische Computer verwendet werden. Der Klassifika- 
tor entscheidet, ob der Merkmalsvektor mit dem Merk- 
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malsvektor einer gespeicherten Stimme so gut uber- 
einstimmt, daB er diese Person als "im wesentlichen 
identisch" mit einer Person klassifiziert, deren Stimme 
gespeichert ist (Anspruch 7, Anspruch 8, Anspruch 9). 

Wird das Verfahren zur Diebstahlsicherung einge- 5 
setzt, dann wird bei dieser — positiven — Klassifizie- 
rung die Diebstahlsicherung ausgeschaltet bzw. das 
"SchloB" mit der als "Schlussel" erkannten Stimme auf- 
geschlossen. Im Falle eines Kfz wird dann beispielsweise 
die Bordelektronik freigegeben oder der Stromkreis 10 
zwischen Batterie und Zundung geschlossen. 

Wird die Stimme als "fremd" klassifiziert, wird die 
Sperre nicht aufgehoben. Optional konnen optische 
oder akustische Warnsignale ausgegeben werden, bei- 
spielsweise mit Hilfe der Hupe oder Lichthupe (An- 15 
spruch 6). 

Vorzugsweise wird die Spannungsversorgung des Si- 
cherungssystems, liber einen Akku gepuffert, von der 
Batterie des Kfz sichergestellt. 

Ebenfalls optional kann ein Ausgang der Auswerte- 20 
einheit an vorhandene Bordlautsprecher (Radioanlage) 
abgeschlossen werden. Dies ermdglichst zusatzlich, daB 
ein Benutzer vom System durch einen akustischen Hin- 
weis (z. B. den Satz "bitte identifizieren sie sich" oder 
einen Piepston) zum Versuch der Identifikation aufge- 25 
fordert wird. 

Es ist bevorzugt daB das "Einlernen" neuer befugter 
Benutzer nur bei ausgeschalteter Diebstahlsicherung 
erfolgen kann, Bevorzugt sind hierfur zwei Tasten im 
Fahrerraum vorgesehen, deren eine den "Einlernmodus" 30 
aktiviert. Ist dieser Modus aktiviert, kann der "neue Be- 
nutzer" mehrmals hintereinander charakteristische 
Laut- oder Tonfolgen von sich geben, beispielsweise 
seinen Namen oder ein frei wahlbares Kennwort spre- 
chen. Dieses Wort oder diese Laut folge wird vom Sy- 35 
stem aufgenommen und vom Klassifikator der Auswer- 
tungseinheit in einer geeigneten Form im Systemspei- 
cher angelegt Anhand genau dieses Wortes wird der 
Benutzer nachher wieder identif iziert 

Bevorzugt erfolgt das Einschalten der Diebstahlsiche- 40 
rung von Kfz bei ausgeschalteter Ziindung uber eine 
weitere Taste im Fahrerraum. Ganz besonders bevor- 
zugt ist es, daB die einmal eingeschaltete Sicherung nur 
durch das gesprochene Kennwort eines befugten Be- 
nutzers wieder deaktiviert wird. 45 

Ein Beispiel soli das VerstSndnis der Erfindung vertie- 
fen. 

Fig. 1 zeigt das Beispiel einer Anordnung, mit der das 
erfindungsgem&Be Verfahren durchgefiihrt werden 
kann, wenn ein Gegenstand wie ein Kfz gegen Diebstahl 50 
gesichert werden soil. 

Im Bordcomputer befindet sich ein Chip 1 fur die 
Datenauswertung (z. B. ein ASIC), der die Abspeiche- 
rung von Stimmen befugter Benutzer in einem Speicher 
2 (z. B. einem EPROM oder EEPROM) steuert. Der 55 
Chip ist an die Stromversorgung der Batterie 6 ange- 
schlossen. Die Versorgung kann iiber Akkus 3 gepuffert 
sein. 

Ein Ausgang des Chips 1 ist mit einer Aufnahmeein- 
heit 4 mit einem Mikrofon verbunden. Ein weiterer Aus- 60 
gang ist uber einen Schalter 5 mit dem Stromkreis ver- 
bunden, der die Batterie 6 mit der Zundung oder Bord- 
elektronik 7 verbindet 

Fakultativ sind Schalter oder Taster zum Scharfstel- 
len der Diebstahlsicherung (Tl) bzw. zum Starten des 65 
Einlernmodus fur neue Benutzer (T2) vorgesehen. Eben- 
falls fakultativ ist ein Ausgang des Chips mit einem 
Lautsprecher 8, beispielsweise dem Radio, verbunden, 



durch welchen eine akustische Aufforderung zur Benut- 
zeridentifikation aktiviert werden kana 

Die Klassifizierung des gesprochenen Wortes ent- 
scheidet, ob der uber eine FFT gewonnene Merkmals- 
vektor der Sprache der Person, die das KfZ offnen oder 
aniassen mochte, mit dem im Speicher 2 Vorgegebenen 
hinreichend ubereinstimmt. Bejahendenfalls wird die 
Fahrzeugtiir gedffnet oder das Aniassen erlaubt 

Mit einer Direktanlassung kann ebenfalls gearbeitet 
werden, so daB Schliissel entbehrlich sind. Das Abschal- 
ten des Motors dagegen kann durch einen weiteren op- 
tionellen Taster erfolgen, hierfur ist die Benutzung des 
Wortes (dessen Merkmalsvektor) nicht zwingend, vor- 
teilhaft sogar entbehrlich. 

Patentanspruche 

1. Verfahren zum Identifizieren einer menschlichen 
Stimme, insbesondere zum Sichern von GegenstSn- 
den gegen Diebstahl, umf assend 

(a) das Aufnehmen einer Stimme mit Hilfe ei- 
ner Auf nahmeeinheit (4), 

(b) das Umwandeln der aufgenommenen aku- 
stischen Signale in elektrische Signale (4), 

(c) das Digitalisieren und Abspeichern der Si- 
gnale in einer Auswerteeinheit mit Speicher (1, 
2), 

wobei ggf. die Schritte (a) bis (c) mit weiteren Stim- 
men wiederholt werden, und 

(d) das Vergleichen digitalisierter Signale einer 
Vergleichs-Stimme mit einer oder mehreren 
solchen, die sich bereits im Speicher (2) der 
Auswerteeinheit (1) befinden, und Identifizie- 
ren der Stimme als im wesentlichen identisch 
mit der oder einer der Stimmen, die im Spei- 
cher (2) der Auswerteeinheit (1) gespeichert 
sind. 

2. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daB die Auswerteeinheit (1) uber einen 
ersten Schalter (T2) so gesteuert wird, daB nur die 
Schritte (a) bis (c) ausgefuhrt werden konnen, und/ 
oder uber einen zweiten Schalter (Tl) so gesteuert 
wird, daB nur Schritt (d) ausgefuhrt werden kann. 

3. Verfahren nach Anspruch 1 oder 2, dadurch ge- 
kennzeichnet, daB die Auswerteeinheit (1) so mit 
dem zu sichernden Gegenstand verbunden ist, daB 
die uneingeschr&nkte Benutzung des Gegenstandes 
bei Feststellen der Identit&t der Vergleichs-Stimme 
mit einer solchen, deren Signale bereits im Speicher 
(2) abgelegt sind, moglich ist, bei Feststellen man- 
gelnder Identity unmoglich ist 

4. Verfahren nach Anspruch 3, dadurch gekenn- 
zeichnet, daB es sich bei dem zu sichernden Gegen- 
stand um ein Kraftfahrzeug handelt, daB die Ver- 
bindung einen Schalter (5) umfaBt, der den zum 
Starten des Kraftfahrzeugs erforderlichen Strom- 
kreis unterbrechen kann und daB die uneinge- 
schrankte Benutzung das Starten und Wegfahren 
ist. 

5. Verfahren nach Anspruch 2 und 4, dadurch ge- 
kennzeichnet, daB sich der erste und/oder der zwei- 
te Schalter (Tl, T2) zur Steuerung der ausfiihrbaren 
Schritte des Identifizierens im Innenraum des 
Kraftfahrzeugs befinden. 

6. Verfahren nach einem der Anspriiche 3 bis 5, 
dadurch gekennzeichnet, daB beim Feststellen 
mangelnder Identitat akustische oder optische 
Warnsignale abgegeben werden. 
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7. Verfahren nach einern der voranstehenden An- 
spruche, dadurch gekennzeichnet, daB in Schritt (d) 
die Stimmen mit Hilfe eines Vergleichsalgorithmus 
verglichen werden, der eine Short-Time- Fourier- 
transformation (FFT) der eingehenden digitalisier- 5 
ten Daten berechnet, wobei der neu entstehende 
Datenvektor mit Hilfe eines Klassifikationsverfah- 
rens mit Datenvektoren der abgespeicherten Si- 
gnale verglichen wird. 

8. Verfahren nach Anspruch 7, dadurch gekenn- 10 
zeichnet, daB fur das Klassifikationsverfahren neu- 
ronal Netze oder synergetische Computer ver- 
wendet werden. 

9. Verfahren nach einem der Anspruche 3 bis 8, 
dadurch gekennzeichnet, daB der Klassifikator ent- 15 
scheidet, ob die verglichenen Merkmalsvektoren so 
gut ubereinstimmen, daB im wesentlichen Identitat 
festgestellt wird. 

10. Vorrichtung zum Identifizieren einer menschli- 
chen Stimme gemaB einem der erwahnten Verfah- 20 
rensanspriiche, umfassend 

(a) eine Aufnahmeeinheit mit Mikrofon (4), 

(b) eine Auswerte- und Steuereinheit (1), 

(c) einen Speicher (2) fur digitalisierte Stimmsi- 
gnale, sowie 25 

(d) eine Verbindung zu dem zu sichernden Ge- 
genstand, die die Inbetriebnahme des Gegen- 
standes steuern kann (5), und/oder 

(e) einen oder mehrere Akkumulatoren (3, 6) 
fur eine gepufferte Spannungsversorgung der 30 
Vorrichtung, und/oder 

(f) einen oder mehrere Lautsprecher (8), und/ 
oder 

(g) Schalter (Tl, T2) zum Steuern der Bedie- 
nungsfunktionen der Vorrichtung. 35 

11. Verwendung mindestens eines gesprochenen 
Wortes als Schiiissel fur das Offnen einer Autotur 
oder als Schiiissel fur das Freigeben des Motorstar- 
tens oder selbiges selbst. 

40 
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